Formulas 



1. ESTADISTICA DESCRIPTIVA 

En general las observaciones se denotan por X 1: ,X n . Una vez clasificadas se tendra las modalidades x-i, ,x k siendo k<n. Se utilizara la notacion: 

n,: frecuencia absoluta de la modalidad Xj 

fii frecuencia relativa de la modalidad Xj 

Nji frecuencia absoluta acumulada de la modalidad Xj 
Fj: frecuencia relativa acumulada de la modalidad Xj 
(li-i,IJ: intervalo i-esimo para datos agrupados 

Xj: usualmente es la modalidad i-esima, pero para datos agrupados en intervalos, denota la marca de clase o punto medio, es decir, x i =(l i . 1 ,li]/2 

a,: para datos agrupados en intervalos, denota la amplitud del intervalo i-esimo, es decir, 

ai=li-li-i 

1.- Medietas de position 

a) Media 

X = A + 'Y J f i d i donde di=X|-A 
X = A + cY J f i u i donde di=c.Ui 

b) Media ponderada 

— _ W]Xl + W2X2 + + WkXk _ HwX 

W1 + W2 + + Wk LW 

c) Media geometrica 

X G =fl(Xf n =fl(x"') 1,n 

i=l i=l 

d) Media armonica 

V " - " - 1 



£l/X ; Xn/x £/ ( /x ( 
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e) Media cuadratica 



i**=J4>,* =,£/,*; 



x c =»± 

I n i=l v n i 



Se verifica: X H < X c < X < X c 



f) Mediana 

n 
yNi.i 

Q 2 =M e = li_] + — .a i con Q 2 cuartil segundo 

Hi 

Im: es el extremo inferior de la clase mediana 

a,: es la amplitud de la clase mediana 

N M : es la frecuencia acumulada de la clase anterior a la clase mediana 

n,: es el numero de observaciones en la clase mediana 



g) Cuartiles. Datos agrupados en intervalos 

n 

-7-Nui 
Qi=/,.i + — .a i con Qi cuartil primero 

Hi 

li_-i : es el extremo inferior de la clase en la que se superan la cuarta parte (25%) de las observaciones 

a;: es la amplitud de la clase mencionada 

N M : es la frecuencia acumulada de la clase anterior a la clase citada 

rv es el numero de observaciones en la clase Qi. 

3n 

-j-Ni-i 

Q3=h-i+ - a t con Q 3 cuartil tercero 

ft; 
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l M : es el extremo inferior de la clase en la que se superan las tres cuartas partes (75%) de las observaciones 

a,: es la amplitud de la clase mencionada 

N M : es la frecuencia acumulada de la clase anterior a la clase citada 

riji es el numero de observaciones en la clase Q 3 . 



h) Moda 



M =li-i+ aj. — — con hj=n/aj y h i . 1 =n i . 1 /a i .i 

hi-i + ht+i 



M =li-i+ c. — — — para amplitud constante de intervalo h M =n M /c y h i+1 =n i+1 /c 
rii-i + m+i 



2.- Medietas de dispersion 

a) Recorrido 

■"i = Xmax"Xmin 

b) Rango intercuartilico 

IQR=Q 3 - Qt 

c) Desviacion media absoluta a la media 

L>.M. = £/;.lx,.-f I 
1=1 

d) Varianza 

;=i ;=i 

e) Cuasi-varianza 
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S 2 =* 



$>,.(*, -X) 2 
k-1 



f) Desviacion tipica 



g) Formulas abreviadas de la varianza 

V x =V d = £ f; . d 2 - ( ^ fi.di) 2 con x i= di+A 

(' i 

V x =c 2 .[ Y_, f i- u i 2 " ( 2 u '- f ') 2 ] con x i= A+c - u i 

* i 

h) Coeficiente de variacion 

o 

c.v.= — 

X 

i) Medidas de dispersion en torno a la mediana 

k 

D = Y j f i .\x l -M t ,\ 

MEDA=mediana |x, -M e | 

j) Tipificacion de variables 

„ x-X 



Pag.- 4 



Formulas 



3.- Medietas de forma 

a) Coeficiente de asimetria de Pearson 

X-M 



G 

A s = 0, distribucion simetrica 

A s < 0, distribucion asimetrica o sesgada a la izquierda 

A s > 0, distribucion asimetrica o sesgada a la derecha 



b) Coeficiente de asimetria de Fisher 

//, 
g = ^-t donde |a 3 es el momento centrado de orden 3, es decir, 

(oj 

^ 3 =S/;.(x-x) 3 

gi= 0, distribucion simetrica 

gi< 0, distribucion asimetrica o sesgada a la izquierda 

gi> 0, distribucion asimetrica o sesgada a la derecha 

c) Coeficiente de apuntamiento de Fisher 

62 4 J 

a 

g 2 = 0, distribucion mesocurtica 
g 2 < 0, distribucion platicurtica 
g 2 > 0, distribucion leptocurtica 

4.- Momentos 

a) En torno al origen 
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it 



m r = — . Observemos que m^ x y m 2 = x x 

n 

b) En torno a la media o centrales 

|x r = — Observemos que: 

n 

)i 2 =o 2 

gi=ix 3 /cr 3 

g 2 =(|i 4 /o 4 )-3 



(a. 2 =m 2 -m 1 2 

(a. 3 =m 3 -3m 2 m 1 +2m 1 3 

(i4=m 4 -4m 3 m 1 +6m 2 mi 2 -3m 1 3 



5.- Datos atipicos-outlier y atipicos-extremos 

LI=Qi-1,5(IQR) FI=LI-1,5(IQR) 

LS=Q 3 +1,5(IQR) FS=LS+1,5(IQR) 



Considerar como valores atipicos outlier los situados entre LI y Fl o entre LS y FS y como atipicos extremos aquellos fuera del intervalo (FI.FS) 

6.- Regresion y correlation 

Linea recta: Y=a +aiX 
Parabola: Y=a +a 1 X+a 2 X 2 

Curva de grado n: Y=a +a 1 X+a 2 X 2 + +a n X n 

Curva exponencial: Y=ab x 
Curva geometrica: Y=aX b 
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Recta de minimos cuadrados: y-y = — \(x-x) donde —j- =Covarianza/ Varianzadex 

o . S , 



Error ti'pico: S e = J — - — - — donde y* es el valor de y para los valores estimados con la recta de minimos cuadrados 
y t -y = (yi -y*) + (y* -y) > variacion total=variacion no explicada+variacion explicada 

Z^, -yf =Z(y, -y*f +Z(y* -y? ■ es decir ' scT(s y 2 )=scE(s e 2 )+scR(s R 2 ) 



5 



Coeficiente de correlacion: r = ± I— \ varia entre -1 y +1 , tambien S e = S y Jl- r 2 . En el caso lineal toma la expresion: 

s 

r = —^- (coefiente de correlacion producto-momento o de Pearson) donde s xy representa la covarianza de las variables x e y y s x s y son las 

S * S y 



desviaciones tipicas de las variables. 

Z x . 2 ".'. 



■x donde n, representa la frecuencia absoluta marginal de la fila i 



N 

Y.y) n i 

— y 1 donde n j representa la frecuencia absoluta marginal de la columna j 



•I 



S„ =- — xy donde n M es la frecuencia absoluta de la fila i, columna i 

y N ' 
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2. DISTRIBUCIONES DE PROBABILIDAD 

1.- Concepto clasico de probabilidad: 



P(A)=lim^- 



Casos favorables a 

P(A)= = — 

Casos posibles N 

2- Propiedades de la probabilidad: 

P(0)=O 

0<P(A)<1 

AcB^ P{A) < P(B) 

P(AuB)=P(A)+P(B)-P(AnB) 

P(A C )=1-P(A) donde A c es el suceso complementario de A. En algunas ocasiones el complementario de A se representa por A' 

Sucesos incompatibles o mutuamente excluyentes: 
Aj n Aj=0 para todo i^j 

3.- Probabilidad condicionada: 

P( A o R ) 

P(B/A) = — siempre que P(A)>0 o tambien P(AnB)=P(A)P(B/A) 

P(A) 

Si los sucesos son independientes: P(A/B)= P(A) o tambien P(AnB)=P(A)P(B) 
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4.- Teorema de Bayes: 
P(SM)= PJS t )PjA,S t ) 

J>(S,)P(A/S,) 

P(Si) se la denomina probabilidad a priori 

P(S/A) se le denomina probabilidad a posteriori (probabilidad sabiendo lo que ha ocurrido posteriormente) 

P(A/Sj) se les denomina verosimilitudes 

5.- Probabilidad total: 

11 

P(A)=^ P(A/Sj) P(Sj) con Sjsucesos mutuamente excluyentes, particion de S y AnSj=£0 

i=l 

6.- Funciones de probabilidad o de densidad y de distribucion: 
a) Variable aleatoria discreta: 

Funcion de cuantia o de probabilidad f(x): 

f(Xi)=P(X= Xi ) 



Condiciones: f(x,) >0 ; V/(x ( .) = 1 

i 

Funcion de distribucion F(x): 

F(x)=P(X<x) 
Condiciones: F(-°o)=o ; F(°o)=1 

F(x)=Y J P(X = x i ) = Y J f(x I ) = F(x l _ l ) + f(x l ) ; f(x l ) = F(x,)-F(x i _ l ) 



P( Xi <X< Xj )= J f(x k ) = F(x j )-F(x i ) 

k=i+l 

b) Variable aleatoria continua 
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Funcion de densidad f(x) 

Condiciones: f(Xj) >0 ; [ f(x)dx = 1 

P(x 1 <X<x 2 )= f f(x)dx 

Funcion de distribucion F(x) 

F(x)=P(X<x) 

X 

P(X<x)= F(x)= \f(t)dt 

P(x 1 <X<x 2 )= F(x 2 ) - F(x { ) = | f(x)dx 

F(-oc)= jf(x)dx = ;FH= jf(x)dx = 1 

F'(x)= f(x) donde F'(x) es la derivada de la funcion de distribucion y f(x) es la funcion de densidad. 
7.- Esperanza matematica: 

n 

en variables discretas: E[X]= y ]p { Xj 

i=l 

en variables continuas: E[X]= \xf(x)dx 
8.- Varianza y desviacion estandar: 
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varianza: V(X)=a 2 =E[X-|j] 2 = E(X 2 )-^i 2 



o en variables discretas: V(X)=a 2 =E[X-|j] 2 = V (x t -jil) 2 p i 

i 

o en variables continuas: V(X)=a 2 =E[X-|j] 2 = j (x t - jU) 2 f (x)dx 
desviacion estandar: a = sJV(X) 
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9.- Distribuciones de probabilidad: 



Distribucion de probabilidad 


Funcion de probabilidad 


Parametros 


Media o 

esperanza matematica 


Varianza 


Binomial 


P(X = k) = 


\kj 


p 


n! 

k„n-k _k„n-k 


n,p 
0<p<1 


np 


npq 


q - p q 

k!(n - k)l 


Poisson 


P(X = k)=^- e A 
k! 


\>0 


X 


X 


Normal 


o-42ti 


-c°<[i<oo 

a>0 


H 


a' 


X A de Pearson 


1 


vf-^-i 


n 


n 


2n 


T(x,n)- 

2 f r 

X 2 (n) surric 


t de cuadrados de n, N(0,1) 
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T de Student 



f(x)= 



t(n)=- 





r n + U 


1 




I 2 ,, 


4n7tT 


'n\ 






kV 



K 



\ X\n) 
n 



r-, X --ML 

[1 + — ] * 

n 



con A — >N(0,1) 



n-2 



Fde 
Snedecor 



f(x)= 



F(x)= 



m 2 


n 2 T 


m + n 

v 2 


J 


r 


K2s 


r 


V2y 





II 



x 2 (n + mx) 2 



m Z 2 (n) 



n-2 
si n>2 



2n (m + n — 2) 
m(n-2) 2 (n-4) 

si n>4 



Relation entre la distribution normal, ji-cuadrado, t de Student yFde Snedecor. 





Distribucion 






F 













F(1,n)=tn 



Distribucion 
t de Student 



L.=z 



F,,~>=z 2 



Distribucion 
Normal 



F(n,~)=Xn /n 



Distribucion 
Ji-cuadrado 



2 2 

Xi =z 
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3. INTERVALOS DE CONFIANZA ASOCIADOS A DISTINTOS PARAMETROS 



Formulas 



Parametro a estimar 



Condiciones 



Estimador 



Distribucion 



Intervalo 



Media 



N(M 

a 2 conocida 



I>, 



Normal 



X ± Z a/2 ~j= poblacion infinita 

Jn 



o N-n 

X ±Zaj 2 —j= A poblacion finita 

n HN-1 



Media 



N(n,o) 

a 2 desconocida n>30 



I* 



Normal 



X i Z a/2 — 1= poblacion infinita 



s N-n 
X ±z„j2—f= A. poblacion finita 

n VN-1 



Media 



N(M 

a 2 desconocida n<30 



2> 



JC =■ 



X±t n .i,a/2(5/Vn) 



Proporcion 



n>30 

0,1<p<0,9 6 np>5 



p proporcion muestral 
n. /? ->B(n,p) 



Normal 



P — Z a/2 A J ~ t ~ poblacion infinita 
n 



^ pq N-n 

P ± Z all A Jt— : poblacion finita 

V n V N -1 



Varianza 



N(n,o) 

a 2 conocida 
n<100 



(n-l)s 2 



Ji-cuadrado 



l= 



(n-l)s (n-l)s 

2 ' 2 

%Ct/2;(n-l) Xl-al2\(n-l) J 
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Parametro a estimar 



Condiciones 



Estimador 



Distribution 



Intervalo 



Varianza 



N(n,o) 

o 2 conocida 
n>100 



(n-l)s 2 



Ji-cuadrado 



l= 



z> 



(n-l)s\ (n-l)s 2 ^ 

2 ' 2 

Xal2\(n-\) Al-«/2;(ii-l) J 



_(j2(n-l)-l-z a/2 ) 2 



(l-a/2);(n-l) 



z> 



_(j2(n-l)-l + z a/2 ) 2 



(a/2);(n-l) 



N(jii,oi) y N(p. 2 ,o 2 ) independientes 
n-i >30 y n 2 >30 
o 2 ! y 2 2 conocidas 



Diferencias de medias 



\-*i -^2 / 



Normal 



\ X l X 2' — Z-al2 




Diferencias de medias 



N(|ii,0i) y N(p.2,o 2 ) independientes 

n-i >30 y n 2 >30 

a 2 ! y o 2 2 desconocidas 



{x-x 2 ) 



Normal 



J~2 ~2 
«1 n 2 



Diferencias de medias 



N(|Xi,ai) y N(p.2,o 2 ) independientes 

n,<30,n 2 <30 

o 2 ! y 2 2 desconocidas pero iguales 



V-^l X 2 ) 



n,+n ? —2 



(x l -x 2 )±t a/2 l— + 



1 1 \{n l -\)s^ + {n 2 -\)r 2 



n x n 2 



n l +n 2 — 2 



Diferencias de medias 



N(p.i,oi) y N(p.2,o 2 ) independientes 

r\i<30,n 2 <30 

cr 2 ! y o 2 2 desconocidas no iguales 



\ x \ X 2 ) 



~2 ~2 
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m 



_ v "l 



( -2 -2V 

^1 I ^2 

n, n^ 



l 2 y 



r -2 \ 2 



'i 



^ -2 A 2 



V 1 / I V ^ / 

Tlj + 1 71 2 + 1 



Diferencias de medias 
datos relacionados 



Normales a d =conocido 



d=x-y 



Normal 



d +z ^ J - 



Diferencias de medias 
datos relacionados 



Normales a d =desconocido, n>30 



d=x-y 



Normal 



rf 0±^/2- 



Diferencias de medias 
datos relacionados 



Normales a d =desconocido, n<30 



d=x-y 



"0 — Vz/2,(n- 



Diferencias de proporciones 



Normales, muestras grandes 

(n 1 p 1 ,n 1 q 1 ,n 2 p2,n 2 q2>5) 



Normal 



(Pl-P 2 ) ± Za/ 



Psy-Pi) , Pz<\-Pi) 



Razon de varianzas de dos 
Poblaciones normales 



N(|Xi,ai) y N(p. 2 ,o 2 ) independientes 
n-i >30 y n 2 >30 
a 2 ] y o 2 2 conocidas 



~2 J 

-2 2 («,-l).(n 2 -l) 

A 2 G>[ 



F de Fisher 



77 F 

r a/2;(n l -l).(n 2 -l) - r l-«r/2;(n,-l).(n 2 -l) 
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4. PRUEBAS PARAMETRICAS 



Formulas 



Aplicacion 


Tipo 

de contraste 


Hip. 
Nula 


Hip. 
Alter. 


Estadistico K 


Distrib. 


Region 
rechazo 


Limitaciones 
y observacione 


Media 
(1 normal) 


BILATERAL 
(a 2 conocida) 


H=Ho 


M^Ho 




x-{i 




Normal 


K>Zo/2 






a/ 

/ 4n 






UNILATERAL 
(o 2 conocida) 


H<Ho 


H>Ho 




Normal 


K>z a 






BILATERAL 
(o 2 desconocida) 
n>30 


|x=Ho 


M^Ho 




x-ju 

Vr 




Normal 


K>Zo/2 






UNILATERAL 
(o 2 desconocida) 
n>30 


H<Ho 


H>N 


Vr 


Normal 


K>z a 






BILATERAL 
(o 2 desconocida) 
n<30 


|x=Ho 


M*Ho 




x-ju 




Student 


K> to/2;(n-1) 






s/ 






UNILATERAL 
(o 2 desconocida) 
n<30 


H<Ho 


H>Ho 


x-ju 

s/ 
/ \n 


Student 


K> t a; (n-1) 




Varianza 
(1 normal) 


BILATERAL 


„ 2 ~ 2 
=o o 


0*0 


(n-l)s 2 


Ji-cuadrado 


2 . 2 






UNILATERAL 


0<O O 


_ 2 _ 2 
>0 


(n-l)s 2 


Ji-cuadrado 


2 
K> >£a;(n-1) 
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Aplicacion 


Tipo 

de contraste 


Hip. 
Nula 


Hip. 
Alter. 


Estadistico K 


Distrib. 


Region 
rechazo 


Limitaciones 
y observacione 


Parametro p 
( 1 binomial) 
(muestras 
grandes) 


BILATERAL 


P=Po 


P*Po 






P-Po 




Normal 


K>Za/2 




IPo^-Po) 
V n 




UNILATERAL 


P^Po 


P>Po 




P-Po 


Normal 


K>z„ 




IPoV-Po) 
V n 


Parametro A 
(1 Poisson) 
(muestras 
grandes) 


BILATERAL 


A = Aq 


A ^ An 




x-\ 




Normal 


K>z„/2 






V n 






UNILATERAL 


A<\ 


A> \ 


fK 

V n 


Normal 


K>z« 
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Iguladad de 

medias 

(2 normales) 


BILATERAL 

a 2 i y o 2 2 conocidas 


^1=H2 


Hi^H2 




Xj x 2 








Normal 


K>z„/2 
















\ n x n 2 








UNILATERAL 
a 2 i y o 2 2 conocidas 


Ul<H2 


H1>U2 


X l ~ X 2 




Normal 


K>z„ 




y n { n 2 




BILATERAL 
n, >30 y n 2 >30 

2 2 

a 1 yc 2 
desconocidas 


|X1=H2 


Hi^M-2 




jq-xj 






Normal 


K>z„/2 




l~2 ~2 
K + *2_ 

\«1 «2 




BILATERAL 
n,<30,n 2 <30 

2 2 

a 1 yo 2 

desconocidas pero 
iguales 


|X1=H2 


H1#H2 




x,-J 2 




Student 


K> ^t72;(n,+n 2 -2) 




1(^-1)^ + ^-1)^ hi 

^ n x + n 2 — 2 ^n { n 2 




BILATERAL 
n,<30,n 2 <30 
cm y o 2 2 

desconocidas y 
distintas 


|X1=H2 


Hl#U2 




jq-xj 






Student 


K> t al2;m 




1*2 ~2 
K + *2_ 

\«1 "2 






m = - 


f ~2 ~2 A 
^1 1 ^2 

^ -2 \ 2 ( - 

71, +1 « 2 


2 

2 2 

2 V 

I ) 

+ 1 
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Aplicacion 


Tipo 

de contraste 


Hip. 
Nula 


Hip. 
Alter. 


Estadistico K 


Distrib. 


Region 
rechazo 


Limitaciones 
y observacione 


Iguladad de 

medias 

(2 normales) 


UNILATERAL 
n, >30 y n 2 >30 

2 2 

Oi ya 2 
desconocidas 


H1<^2 


Hi>M-2 


X \ ~ X 2 


Normal 


K>z„ 




^ n x n 2 




UNILATERAL 
n 1 <30,n 2 <30 

2 2 

cr, yo 2 

desconocidas pero 
iguales 


H1<H2 


Hi>M-2 


X l ~ X 2 


Student 


K> ^a;(n,+n 2 -2) 




\{n l -l)s 2 1 +(n 2 -\)sl Ml 
V n { + n 2 — 2 v «j n 2 




UNILATERAL 
n 1 <30,n 2 <30 

2 2 

cr, yo 2 

desconocidas y 
distintas 


Hi<M-2 


H1>^2 


x, — x 2 


Student 






l~2 ~2 

|i + i 


K > ? a;m 

f "2 *2\ 
S \ 1 ^2 

m= ^"\ HlJ 

— M 
V n \ J | V K 

n x + 1 rc 2 


2 

>Y~ 2 

i ) 
+ i 


Diferencia de 

Medias 

(2 normales) 

datos 

relacionados 


BILATERAL 
a d =conocido 


d =0 

con 
d =Xi-x 2 


do^O 


d 


Normal 


K>z„/2 






BILATERAL 

a d =desconocido, 

n>30 


d =0 

con 

d =xi-x 2 


do^O 


d 


Normal 


K>Z(,/2 






BILATERAL 

o d =desconocido, 

n<30 


d =0 

con 
d =Xi-x 2 


do^O 


d 

yjn 


Student 


K> ^a/2;(n-l) 
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Aplicacion 



Tipo 

de contraste 



Hip. 
Nula 



Hip. 
Alter. 



Estadistico K 



Distrib. 



Region 
rechazo 



Limitaciones 
y observacione 



Iguladad de 
varianzas 
(2 normales) 



BILATERAL 



~ 2 ~ 2 
a i=a 2 



_2 2 

a i*cy 2 



F Fisher 



^ L-M-a72;(n,-l).(n 2 -l) ' ^a/2;(n,-l).(n 2 -l) J 



UNILATERAL 



a 2 ,<o 2 2 



~ 2 ~ 2 
a i>a 2 



F Fisher 



K> F, 



a;(« 1 -l),(n 2 - 1 ) 



Igualdad p 
( 2 binomiales) 
(Pi y P2 
desconocidos) 



BILATERAL 



PrP2=D 



Pi -P2#D 



SiD=0 



SiD^O 



Pl~ Pi 



Normal 



K>z a 



\pQ--p) , p(i-p) 



7? 



H-, 



1 "2 



/AA-A) , Pi^-Pi) 



Pi=— 



p 2 


n 2 


entonces 


P = 


•4-1 "I - J\"j 


n x + n 2 



UNILATERAL 



Pi-p 2 <D 



PrP2>D 



SiD=0 



SiD*0 



Pi- Pi 



\p(\-p) | p(l-p) 



Normal 



/? 



«i 



l "2 

(Pi-P 2 )- D 



\PiO--Pi) , Pi^-Pi) 



K>z a 



P 2 



•V, 






ft. 



entonces 



Ai "" r .\'} 



n t + n 2 
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5. PRUEBAS NO PARAMETRICAS 



Formulas 



Prueba de 



Nombre 



Escala 
medida 



de 



Aplicacion 



Estadistico 



Region de rechazo 



Limitaciones 
observaciones 



Una 
muestra 



Ji-cuadrado 



N,0 



Bondad de ajuste 
H :F n (x)=F(x) 



2 ^(o,-e,.) 2 

X n = /_, s '9 ue una ji-cuadrado con g.l.=1 



{X>cte} 



;=i 



E|>5 para mas del 80% 
N>50 



Kolmogorov- 
Skmirnov 



0,l 



Bondad de ajuste 
H :F n (x)=F(x) 



D=Max.| F„(x)-F(x)| 



{D>cte} 



La variable en la poblacion es 
continua 



Binomial 



N (dicotomica) 



Bondad de ajuste 
H :F n (x)=B(N,p) 



*-SiNp6Nq<10 

p(x)=2 J . pq 

i=o v l ) 

*-SiNp6Nq>10 

(f m ±0,5)-ju x 



4Npq 



siendo p, x =Np 



■ {T<cte} 

■ {Q>cte} 



Para poblaciones con 2 
categorias 



Test de rachas 



O, I 



Aleatoriedad 



-N<20 



r — E(r) 
Si N>20 Z = — , donde 



JW) 



- P(r<r 1 )=0,025 
P(r<r 2 )=0,975 
-I I 



Para datos continuos u 
ordinales test sobre o bajo la 
mediana 



- {z>cte} 



„. N 2nm , TT , , 2nm(2nm — n — m) 

E{r) = + 1 V(r) = — - 

n + m (n + m) (n + m + Y) 
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Formulas 



Prueba de 



Nombre 



Escala 
medida 



de 



Aplicacion 



Estadistico 



Region de rechazo 



Limitaciones 
observaciones 



Dos 

muestras 
relacionad 
as 



Mc.Nemar 
para 

significacion de 
los cam bios 



N 



Diferencia 
antes/despues 
H :A=D 6 A=D=0 



*- Si (A+D)/2<5 --> Usar dist.binomial 
con N=A+D, x menor de A 6 D p=0.5 



{X>cte} 



Dos categorias- 
Datos dicotomizados 



Prueba de los 
signos 



Ho:fi=f2 
Hi:fi>f 2 6fi<f 2 6 



- Si N< 25 



pU) = Z 



r N \ 



0,5'.0,5' 



V J 



- Si N>25 entonces Z = 



*±0,5 — N 

2 

2 



- p<0.05 

- {Q>cte} 



Muestras con la misma 
extension 



Prueba de 
Wilcoxon 



0,l 



Ho:fi=f2 

Hi:fi>f 2 6fi<f 2 6 

M 2 



SiN<25; T = min(T p ,T n ) 



- Si N>25 entonces Z : 



n(n + l) 



n(n + l)(2n + l) 



24 



*- {T<cte} 
*- {Q>cte} 
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Formulas 



Prueba de 



Nombre 



Escala de medida 



Aplicacion 



Estadistico 



Region de rechazo 



Limitaciones 
observaciones 



Dos 

muestras 
independie 
ntes 



Fisher 



H :lndependencia 
Pij = Pi.Pj 



Po=" 



p=Zpi 



(A + B)\(C + D)l(A + C)\(B + D)l 



{p<a} ver Tocher 



N!A!B!C!D! 



Dos categorias - Datos 
dicotomizados. Tablas 2x2 
(alguna celda ei<5) 



Kolmogorov- 
Skmirnov 



0,1, 



Ho:Fa=Fb 

Hi: F A >F B 6 F a <F b 

o F A #F B 



*- Si n=m=N< 40 

D,= 



F F 

ai bi 



n m 



D=max {Di} 



*-{D> cte} 
*-{ X 2 > cte} 
*-{z>cte} 



■ Si n=m=N>40 % = AD 



n.m 



n + m 



con g.l=2 



-tambien z=. 



m.n 



m + n 



Las variables en la poblacion 
son continuas 



Ji-cuadrado 



H :lndependencia 
Pij = PiPj 



vv^- e .) 



i=\ j=i 

sigue una x 2 con (r-1).(k-1) grados de libertad 



e ij 



■ {& cte} 



Datos categoricos. Distinto 
tratamiento tablas 2x2 que 
tablas RxK 



Test de 
mediana 



0,l, 



H : Igualdad de 
medianas 



Para m+n 2 <20 => p=p de Fisher 
Para m+n 2 >20 => 



N 



x 2 = 



(\ i ^v 

\AD-BC\ — - 



( A + B)(C + D)(B + D)(A + C) 



■ m a} 

■ (X 2 ^ cte} 
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Formulas 



Prueba de 


Nombre 


Escala de medida 


Aplicacion 


Estadistico 


Region de rechazo 


Limitaciones y 
observaciones 


Dos 

muestras 

independie 

ntes 


U-Mann 
Whitney 


0,1 


H :ni=p-2 


*- Si n,m >20 

tt n(n + Y) 

U n =n.m + — —R 

m(m + l) 
U b =n.m+ R b 

se cumple U a +Ub=n.m 

U=min.(U a ;U b ) 

*- Si n,m > 20 se cumple 


*- {U< cte} 
*- {Q>cte} 




ln.m(n + m + l) 

u-n.m/2 y <7 = 

V 12 




Test de Wald- 
Wolfowitz 


0,1, 


Ho:fi=f2 


*- Si n,m < 20 r=rachas 

„.„. 2n.m 

*- Si n,m >20 E(R) = h 1 

n + m 

2.n.m(2nm — ti — m) 
V(R) — 

(n + m) (n + m + l) 


*- {r< cte} 
*- {Q>cte} 


Distribucion continua. Si hay 
muchos pares ligados no se 
puede aplicar la prueba 
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Formulas 



Prueba de 



Nombre 



Escala de medida 



Aplicacion 



Estadistico 



Region de rechazo 



Limitaciones 
observaciones 



K-muestras 
relacionadas 



Q de 

Cochran 



Comparacion 

entre los K 

grupos. 

H : No existe 

diferencia entre 

los sujetos en los 

K-grupos 



(k-l) 



k f k \ 2 ~ 


*2>;- 


I a 




j= i \j= i J j 



*- { X \-i >cte} 



K±h-±t, 

7=1 7=1 

k=numero de grupos A= suma de columnas L= suma en las 

filas 

sigue una x 2 con K-1 grado de libertad 



Analisis de 
la varianza 
de Friedman 



0,l 



Comparacion de 
medias 



Ar 



12 



nk(k + Y)j 



^R*-3n(k + l) 



donde 



H :ni=n 2 = 



=Hk 



*- k=3 1<n<10 6 k=4 1<n<5 

utilizar tablas. 

*-En otro caso: {x 2 k-i Scte} 



Tamaho de los grupos 
iguales 



n=numero de filas k= numero de columnas R= suma de 
rangosen lacolumnaj 
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Formulas 



Prueba de 


Nombre 


Escala de medida 


Aplicacion 


Estadistico 


Region de rechazo 


Limitaciones y 
observaciones 


K-muestras 
independientes 


Ji- 
cuadrado 


N 


H :lndependencia 
Pij = Pi.Pj 


d= > > sigueunax con (r-1).(k-1) grados 

de libertad 


*-{ X 2 >cte} 


Datos categoricos. Distinto 
tratamiento para tablas 2x2 
que para tablas FxC 




Extension 
del test de 
la 
mediana 


0,1 


H :lgualdad de 
medianas 


2 k ( _ e ) 2 
d= > > sigue una x con (2-1 ).(k-1 ) grados 

de libertad 

k=n Q de columnas=n Q de grupos 


*- (X 2 ^ cte} 


Formar tablas 2xK 




Analisis 

de la 

varianza 

de 

Kruskal- 

Wallis 


0,1 


H :No hay 
diferencia entre 
los k-grupos 


12 * R 2 

- H = V — - - 3( N + 1) N numero total 

NiN + DJlnj 

de sujetos y n, el numero de sujetos de cada grupo. 

_ u ^ H 


- k=3 y ni,n 2 y n 3 <5 tabla K-W. 

- En otro caso x 2 critico para 
g.l=k-1. 


Las variables tienen como 
base una distribucion 
continua 


c l H T 

N 3 -N 
donde T=t 3 - 1 y t es el numero de sujetos empatados en cada 
grupo. 
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Formulas 



Prueba de 


Nombre 


Escala 
de medida 


Aplicacion 


Estadistico 


Region de rechazo 


Limitaciones y 
observaciones 


Correlacion no 
parametria 


C coeficiente 
de 


N 


Observar grado 
de causalidad 




*-{ X 2 >cte}g.l=(r-1).(k-1) 


Dato categorico. No alcanza 
valor 1. No es comparable. 


C= r donde > > sigue una x 

\N + z t<Ti e tj 




contingencia 








Influye frec.de la celda. Se 










con (r-1).(k-1) grados de libertad. 
r=n Q de filas=n Q de categorias 




emplea mejor: V de Cramer 


v=F 










k=n Q de columnas=n Q de grupos 




\Nm 










0<C<1 




m=min(r-1,c-1) 




Correlacion 





r s =0 no hay 


N 


*- Para valores N<=10 tablas 






de rangos de 




ninguna relacion 


de Spearman RC a ={r s > cte} 






Spearman r s 






r. =1 '-? si hay ligas se utiliza la formula: 

N -N 


*-N>10 












2^Zx 2 Zy 2 


JN-2 
t=r s I — se distribuye 

como t de Student de g.l= N - 2 












, v 2 N 3 -N v 

donde 2^X = lJ x 














^ 2 N 3 -N ^ 

Z^y = 12 Zjy conT=(t 3 -t)/12 














-1<r s <1 
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Formulas 



Prueba de 



Nombre 



Escala 
medida 



de 



Aplicacion 



Estadistico 



Region de rechazo 



Limitaciones 
observaciones 



Correlacion no 
parametria 



Correlacion 
de rango de 
Kendall:T. 



O 



t=0 no hay 
ninguna relacion 



S 



y 2 N(N-i) 



si hay ligas 



*-N<10tablade Kendall 

RC a ={S>cte} 

*-N>10 



T = 



Jy 2 N(N-l)-T^y 2 N(N-l)-T y 



u T =0 a T = 



j 2(2N + 5) 
9N(N-1) 



donde T x =1/2It(t-1) y t numero de observaciones ligadas en 
cada grupo de liga de la variable X. De forma similar T y 

-1 <T<1 



z= 

<Jt 

RC ={z>cte} 



Correlacion 
parcial de 
rango de 

Kendall :T xyz 



O 



t xy .z=0 no hay 
ninguna relacion 



* xv.z 



* xy T z\* xz 



J(l- T 2 zy )(l- T 2 J 



No tiene ninguna prueba de 
signification solo observar si 
Vz=tx y para inferir resultado 
por la segunda 



Coeficiente de 
Concordancia 
de Kendall: W 



O 



Concordancia 
entre k 

ordenaciones 
semejantes 



kW-l 

■ r,„„ = correlacion de rango de Spearman entre 



los 



flr\ 



vh 



-w= 



k-\ 

pares posibles 
S 



*- n<7 tabla de concordancias 

de Kendall RC ={s>cte} 

*- Si n>7 calcular x 2 =k(N-1 )W 

-->X 2 con gl=N-1 



*- 0<W<1 pero r sav varia entre 
-1y1 



12 



si hay pocas ligas. 



k\N~N) 



-w=- 



^k 2 (N 3 ~N)-kYT 



donde T= 



I> 3 -o 



12 



siendo t=numero de observaciones en un grupo ligado por un 
rango dado 
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6. INTRODUCCION AL MUESTREO 



Muestreo aleatorio simple: 



Formulas 



Parametro 


Estimador del 
parametro 


Varianza del 
estimador 


Estimador de la 
varianza 


Intervalo de 
confianza 


Media 




V(y) = -(l-f) 

n 


V(y) = -(l-f) 

n 


y + kyjviy) 


y - 

n 


Total 


Y = Ny 


V(Y) = N 2 V(y) 


2 

V(Y) = —N 2 (l-f) 
n 


Y±k^V(Y) 


Proporcion 


a 

P=- 

n 

A = Np 


m= N - nPQ 

N-l n 
V(A) = N 2 V(p) 


v{ P ) = N ~ npq 

N n-l 
V(A) = N 2 V(p) 


p±kjv(p) 


A±kp(A) 



Parametro 



Poblacion finita 



Poblacion infinita 



Media 



2 2 

e s 

—r + — 
k 2 N 



Total 



- + Ns 2 



Proporcion 



Caso P=Q= 



1 



N 
N-l 



PQ 



k 2 N-l 



N 
N-l 



4-e 2 1 



N-l 



k 2 PQ 



4e 2 
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Muestreo estratificado: 

Calculo del tamafio muestral 

X- 



L w 2 s 2 



w 
Para la media n= 



M "J 



P 1 1 L 

k 2 NJ-[ J J 

L N 2 S 2 



z^ 



7=1 W; 

Para el total n= ^ — l 



L Af PO 

rr J at.-i 



Para la proporcion n= — j- ; 






k 2 ,v 

n, 2 2 AT. 

donde w. = — yS es la cuasivarianza poblacional. Recordar que 5 = — P i Q i 

1 n J Nj-l 
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Formulas 



Formulas 



Afijacion: 

n 

a) Afiiacion uniforme , donde se reparte por igual entre todos los estratos n .= — 

L 

n. 

b) Afiiacion proporcional , la que se hace en proporcion al tamafio del estrato. — - = cte. 

N J 
Teniendo, en este caso, todas las unidades muestrales la misma probabilidad de ser seleccionadas en la muestra. 

c) Afiiacion optima o de minima varianza , donde se eligen los rij de forma que minimicen la varianza para un n fijo: 

n.=- 7i 



5>A 



y'=i 



d) Afiiacion para un coste , en la que se eligen los rij de forma que minimicen la varianza para un coste fijo, C que generalmente se expresa como 

L 

c = c + / \ n p , donde q es el coste de elegir una unidad en el estrato j y c es el coste inicial, se obtiene los tamafios: 

7=1 

n j=- r" 

o tambien 

(c-cJWjSj l 



n J= — I " 



.H 
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Formulas 



Muestreo por conglomerados: 

Tamano de la muestra.- Suponiendo que se ha elegido el tamafio del conglomerado y que se intenta que sea minima la varianza entre conglomerados, 
entonces el numero de conglomerados para la estimacion de la media poblacional sera: 

e 2 _ N-n 2 

k 2 ~ NnM 2 ' Sc 

n 

\2 



n-\ 



donde s = — que se obtiene de una muestra previa. 



Ns 2 , 



Y por tanto n = — 

-NM l + s 



e m „- 2 , 2 



* 



2 
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